本文正式对系统之间的战略重复交互作用,包括机器学习(ML)模型和相关的解释方法,以及正在寻求预测/标签的最终用户,并通过查询/输入进行解释,游戏理论。在这个游戏中,恶意的最终用户必须从战略上决定何时停止查询并尝试妥协系统,而系统必须战略性地决定其与最终用户以及何时分享的信息(以嘈杂的解释的形式)停止分享,所有这些都不知道最终用户的类型(诚实/恶意)。本文使用连续的随机信号游戏框架正式对这种权衡进行了正式建模,并在这种框架内表征了马尔可夫的完美平衡状态。
translated by 谷歌翻译
While human evaluation is the most reliable metric for evaluating speech generation systems, it is generally costly and time-consuming. Previous studies on automatic speech quality assessment address the problem by predicting human evaluation scores with machine learning models. However, they rely on supervised learning and thus suffer from high annotation costs and domain-shift problems. We propose SpeechLMScore, an unsupervised metric to evaluate generated speech using a speech-language model. SpeechLMScore computes the average log-probability of a speech signal by mapping it into discrete tokens and measures the average probability of generating the sequence of tokens. Therefore, it does not require human annotation and is a highly scalable framework. Evaluation results demonstrate that the proposed metric shows a promising correlation with human evaluation scores on different speech generation tasks including voice conversion, text-to-speech, and speech enhancement.
translated by 谷歌翻译
Many problems can be viewed as forms of geospatial search aided by aerial imagery, with examples ranging from detecting poaching activity to human trafficking. We model this class of problems in a visual active search (VAS) framework, which takes as input an image of a broad area, and aims to identify as many examples of a target object as possible. It does this through a limited sequence of queries, each of which verifies whether an example is present in a given region. We propose a reinforcement learning approach for VAS that leverages a collection of fully annotated search tasks as training data to learn a search policy, and combines features of the input image with a natural representation of active search state. Additionally, we propose domain adaptation techniques to improve the policy at decision time when training data is not fully reflective of the test-time distribution of VAS tasks. Through extensive experiments on several satellite imagery datasets, we show that the proposed approach significantly outperforms several strong baselines. Code and data will be made public.
translated by 谷歌翻译
大多数强化学习算法隐含地假设强同步。我们提出了针对Q学习的新颖攻击,该攻击通过延迟有限时间段的奖励信号来利用该假设所带来的漏洞。我们考虑了两种类型的攻击目标:目标攻击,旨在使目标政策被学习,以及不靶向的攻击,这只是旨在诱使奖励低的政策。我们通过一系列实验评估了提出的攻击的功效。我们的第一个观察结果是,当目标仅仅是为了最大程度地减少奖励时,奖励延迟​​攻击非常有效。的确,我们发现即使是天真的基线奖励 - 延迟攻击也在最大程度地减少奖励方面也非常成功。另一方面,有针对性的攻击更具挑战性,尽管我们表明,提出的方法在实现攻击者的目标方面仍然非常有效。此外,我们引入了第二个威胁模型,该模型捕获了一种最小的缓解措施,该模型可确保不能超出顺序使用奖励。我们发现,这种缓解仍然不足以确保稳定性延迟但保留奖励的命令。
translated by 谷歌翻译
现有的对抗示例研究重点是在现有自然图像数据集之上进行数字插入的扰动。这种对抗性例子的构造是不现实的,因为攻击者由于感应和环境影响而在现实世界中部署这种攻击可能是困难的,甚至是不可能的。为了更好地理解针对网络物理系统的对抗性示例,我们提出了通过模拟近似现实世界的。在本文中,我们描述了我们的合成数据集生成工具,该工具可以可扩展收集具有现实的对抗示例的合成数据集。我们使用Carla模拟器收集此类数据集并演示与现实世界图像相同的环境变换和处理的模拟攻击。我们的工具已用于收集数据集以帮助评估对抗性示例的功效,并可以在https://github.com/carla-simulator/carla/pull/4992上找到。
translated by 谷歌翻译
糖尿病性视网膜病(DR)是长期存在的,未经检查的糖尿病的并发症,是世界上失明的主要原因之一。本文着重于改进且可靠的方法,以提取DR,VIZ的某些功能。血管和渗出液。使用多个形态和阈值手术分割血管。对于渗出液的分割,使用了原始图像上的K均值聚类和轮廓检测。进行大量降噪以消除血管分割算法的结果中的假阳性。还执行了使用K-均值聚类和模板匹配的光盘定位。最后,本文提出了一个深卷卷神经网络(DCNN)模型,具有14个卷积层和2个完全连接的层,用于自动,二元诊断。血管分割,视盘定位和DCNN的精度分别为95.93%,98.77%和75.73%。源代码和预培训模型可用https://github.com/sohambasu07/dr_2021
translated by 谷歌翻译
图形神经网络(GNNS)最流行的设计范例是1跳消息传递 - 反复反复从1跳邻居聚集特征。但是,1-HOP消息传递的表达能力受Weisfeiler-Lehman(1-WL)测试的界定。最近,研究人员通过同时从节点的K-Hop邻居汇总信息传递到K-HOP消息。但是,尚无分析K-Hop消息传递的表达能力的工作。在这项工作中,我们从理论上表征了K-Hop消息传递的表达力。具体而言,我们首先正式区分了两种k-hop消息传递的内核,它们在以前的作品中经常被滥用。然后,我们通过表明它比1-Hop消息传递更强大,从而表征了K-Hop消息传递的表现力。尽管具有较高的表达能力,但我们表明K-Hop消息传递仍然无法区分一些简单的常规图。为了进一步增强其表现力,我们引入了KP-GNN框架,该框架通过利用每个跳跃中的外围子图信息来改善K-HOP消息。我们证明,KP-GNN可以区分几乎所有常规图,包括一些距离常规图,这些图无法通过以前的距离编码方法来区分。实验结果验证了KP-GNN的表达能力和有效性。 KP-GNN在所有基准数据集中都取得了竞争成果。
translated by 谷歌翻译
每年大约有6,800次自然灾害发生,由于气候变化的影响,这一令人震惊的数量继续增长。改善自然灾害反应的有效方法包括执行变更检测,地图对准和视觉辅助导航,以允许节省时间的救生援助。当前的软件仅在地面高于地面九十度的NADIR图像上发挥最佳功能。无法概括倾斜的图像增加了计算图像的地心姿势的需求,这是其在重力方面的空间取向。这项深入学习调查提出了三个卷积模型,以使用5,923个Nadir和斜红,绿色和蓝色(RGB)卫星图像预测地心的姿势。第一个模型是一种自动编码器,将256 x 256 x 3图像凝结到32 x 32 x 16潜在空间表示形式,证明了从数据中学习有用功能的能力。第二个模型是U-NET完全卷积网络,其SKIP连接用于预测每个图像的相应像素级掩码。该模型在测试数据上实现了0.335米的中值绝对偏差为0.335米,R2为0.865。之后,将高程面膜与RGB图像串联以形成馈入第三个模型的四通道输入,该输入预测了每个图像的旋转角度和比例,即其地理为中心姿势的组件。这种深度卷积神经网络在测试数据上达到了0.943的R2,大大优于研究人员设计的先前模型。本研究中建立的高准确软件有助于制定和导航程序,以加速救灾并挽救人类的生命。
translated by 谷歌翻译
无线传感器网络是当前时代最有前途的技术之一,因为它们的规模较小,成本较低和易于部署。随着无线传感器数量的增加,生成丢失数据的概率也会上升。如果用于决策,这种不完整的数据可能会导致灾难性后果。有很多关于这个问题的文献。但是,大多数方法显示出大量数据丢失时性能降解。受图形信号处理的新兴领域的启发,本文对无线传感器网络中的Sobolev重建算法进行了一项新研究。对几个公开数据集进行的实验比较表明,该算法超过多个最新技术的最大利润率为54%。我们进一步表明,即使在大规模数据丢失情况下,该算法也会始终检索丢失的数据。
translated by 谷歌翻译
本文调查了具有不平等专业知识的组织之间竞争的动态。多智能体增强学习已被用来模拟和理解各种激励方案的影响,旨在抵消这种不等式。我们设计触摸标记,基于众所周知的多助手粒子环境的游戏,其中两支球队(弱,强),不平等但不断变化的技能水平相互竞争。对于培训此类游戏,我们提出了一种新颖的控制器辅助多智能体增强学习算法\我们的\,它使每个代理商携带策略的集合以及通过选择性地分区示例空间,触发智能角色划分队友。使用C-MADDPG作为潜在的框架,我们向弱小的团队提出了激励计划,使两队的最终奖励成为同一个。我们发现尽管激动人心,但弱小队的最终奖励仍然缺乏强大的团​​队。在检查中,我们意识到弱小球队的整体激励计划并未激励该团队中的较弱代理来学习和改进。要抵消这一点,我们现在特别激励了较弱的球员学习,因此,观察到超越初始阶段的弱小球队与更强大的团队表现。本文的最终目标是制定一种动态激励计划,不断平衡两支球队的奖励。这是通过设计富有奖励的激励计划来实现的,该计划从环境中取出最低信息。
translated by 谷歌翻译